JSAI2026 検索エンジンのAI要約機能における参照記事選択基準の分析

テーマ

GoogleのAI Overviewsが、どのような記事を参照元として選びやすいかを分析する研究

生成型の検索体験

従来のSEO的な順位ではなく、検索クエリと記事本文の「意味的な適合度」に注目する

検索のトレンド

SEO（検索エンジン最適化）からGEO（生成エンジン最適化）へ

先行研究: GEOの概念の提唱（Aggarwal+ 2024）

可視性が最大40％向上

AI要約中に引用された文の長さと位置、LLMによる主観的な評価を掛け合わせて計算される独自スコア

先行研究: AIがどのような情報源を好んで引用するか（Chen+ 2025）

ChatGPT、Perplexity、Claude、Gemini

AI検索は知名度の高い大手のブランドを優遇する傾向がある

先行研究: AIようやくエンジンが引用元を選ぶ際に、Webページの性質がいかに影響するか（Kumar+ 2025）

Metadata & Freshness, Semantic HTML, Structured Data

が重視される傾向

背景課題

検索体験は、リンク一覧からAIによる回答生成へ移りつつある

SEOだけでなく、AIに参照されやすくするGEOが重要になっている

既存研究では、HTML構造、メタデータ、情報源の種類などは分析されている

しかし、本文内容そのものがクエリ意図にどれだけ合っているかは十分に検証されていなかった

提案

日本語ModernBERTを使い、クエリとWebページ本文の意味的適合度を予測するランキングモデルを構築

Google のオーガニック検索上位100件を使って、検索順位を再現するようにペアワイズ学習する

入力: Query + HTML

そのモデルで、AI Overviewsの参照記事と通常検索結果の記事を比較する

意味的な類似度を計算

データ収集

Informationalクエリに限定

知識や情報を得るために使用するクエリ

考察

AI Overviewsは、単に通常検索上位をそのまま引用しているわけではなさそう

通常検索よりもさらに、クエリ意図に強く合った本文を選んでいる可能性がある

GEOでは、ドメイン権威性やHTML構造だけでなく、本文が検索意図にどれだけ正確に応答しているかが重要になる

感想 daiiz.icon

先行研究と定量的な観察のアプローチを知れてよかった

自分の同人誌では定性的な言及しかできてなかった